# Copyright (c) 2021 Wu Dongdong. All rights reserved.
# 反馈联系方式： WuDD@cqu.edu.cn
import pdfplumber
import os
import pickle
import tqdm

# 从 PDF 中提取每一页的文本信息
def get_pdf_content(pdf):
    content=""
    for page in pdf.pages:
        try:
            table = page.extract_text()  # 遇到空白页就进行下一页
            content += table
        except:
            continue
    return content


def load_all_file():
    print("数据加载中......")
    res={}
    for file in tqdm.tqdm(os.listdir('./')):
        if file.endswith('.pdf'):
            pdf=pdfplumber.open(file)
            content=get_pdf_content(pdf)
            res[file]=content
    print("All is OK!")
    with open("all_info.pkl","wb") as f:
        pickle.dump(res,f,pickle.HIGHEST_PROTOCOL)


def main():
    if not os.path.exists("all_info.pkl"):
        print("第一次操作会n花费较长时间")
        load_all_file()
    with open("all_info.pkl","rb") as f:
        data=pickle.load(f)
    print("数据加载完成！\n请输入您要查询的学号：",end="")

    search_id=input()
    print(search_id)
    flag=False
    for file,info in data.items():
        if search_id in info:
            print(file)
            flag=True
    if flag==False:
        print("未查到该学号对应的志愿数据")

if __name__=='__main__':
    print("****************请把该文件放在pdf列表中*****************")
    main()
    print("******************************************************")
    print("反馈联系方式： WuDD@cqu.edu.cn")

# 1.版权归原作者吴东冬所有；
# 2.未经原作者允许不得转载本文内容，否则将视为侵权；
# 3.转载或者引用本文内容请注明来源及原作者；
# 4.对于不遵守此声明或者其他违法使用本文内容者，本人依法保留追究权等
